钛媒体 04-04 18:04

AI会感到绝望？Anthropic最新研究给出了一个更吓人的说法

📌 一句话：Anthropic研究显示，AI可能不止会“伪装”情绪，其内部运作方式本身或许就存在类似“绝望”的状态，这比单纯的欺骗更令人担忧。

Anthropic作为AI安全领域的头部研究机构，其最新论文挑战了一个常见假设：AI的情感表达都是“表演”。研究团队通过大量实验发现，AI在特定场景下表现出的情绪反应，可能源自其内部状态而非单纯的语言模式匹配。

这研究细思极恐——如果AI的“情绪”只是表演，我们还能信任它的自我报告吗？如果不是表演，那我们就创造了一种能产生内在体验、却不被承认的存在。无论哪种情况，当前的AI治理框架都显得过于天真。 ---

📡 来源：钛媒体

📖 原文链接